查看原文
其他

阿里妈妈技术团队4篇论文入选WSDM 2022

阿里妈妈技术团队 阿里妈妈技术 2022-10-31

关于WSDM


WSDM(The International Conference on Web Search and Data Mining)是信息检索与数据挖掘领域的国际顶级会议,由 SIGIR、SIGKDD、SIGMOD 和 SIGWEB 四个专委会协调筹办,在互联网搜索、数据挖掘领域享有较高学术声誉。今年将于2022年2月21日-2月25日在美国召开。
近日,WSDM 2022 论文接收结果公布,本次会议共收到来自 786 篇长文投稿,仅有 159 篇长文被录用,录用率约20.23%。

阿里妈妈论文概述


阿里妈妈技术团队有 4 篇论文被接收,我们将陆续邀请论文作者为大家详细解析论文思路和技术成果,欢迎关注!

  Leaving No One Behind: A Multi-Scenario Multi-Task Meta Learning Approach for Advertiser Modeling

基于元学习概念的多任务多场景广告主建模
摘要: 广告主在许多电商平台中都发挥着重要的作用,比如淘宝、亚马逊等。满足广告主的营销需求并促进广告主店铺的发展对于电商平台的长期繁荣至关重要。然而,学术界目前的研究侧重于用户侧建模(如ctr预估),对于广告主建模的研究(不同广告主的需求和投放效果)的关注较少。和用户侧建模方式不同,广告主建模涉及了多种任务,比如广告主的消耗、日活、广告主店铺内的点击等。此外,一些大的电商平台往往会为广告主提供多种营销场景,比如搜索场景、展示场景、直播场景等,广告主的营销行为往往会分散在这些场景。为了更好的对广告主建模,我们需要将多种任务和多种场景同时考虑进来,这种建模方式有如下挑战:第一,对每个场景/任务分别建模,在工业界的应用角度来说维护成本过高;第二,在小场景或者新场景下数据较少,模型效果会很差;第三,不同场景之间有着复杂的关联关系,场景的关联关系甚至会随着任务的不同而发生变化。为了应对这些挑战,我们提出了M2M,一种基于元学习概念的多任务多场景建模方法,可以同时预测多个场景中的多个任务。在M2M模型中,我们设计了元学习单元来显式建模场景关联。进一步的,我们将设计的元学习单元和多任务架构结合,在底层的attention结构中加入元学习单元捕捉不同任务下的动态场景关联,在上层的塔网络结构中加入元学习单元强化特定场景的表征。我们通过阿里妈妈的工业数据集离线验证了M2M的有效性,并在加速宝业务上进行了AB 实验,多个业务指标(如日活与arpu)均有显著提升。目前该模型已在阿里妈妈全量部署,服务于多个广告主相关的业务。
▐  CAN: Feature Co-Action Network for Click-Through Rate Prediction
CAN:一种高效灵活特征交互的点击率预估模型
摘要: 特征交互对点击率(CTR)预估任务而言至关重要。深度神经网络(DNN)可以从原始稀疏特征中自动学习特征间的隐式非线性交互,因此被广泛应用于CTR预估。然而,此类隐式特征交互并不能充分捕捉原始特征间的关联信息。以Factorization Machine (FM)及其变体为例,将特征A和特征B的笛卡尔积这类显式特征交互表示作为额外特征加入模型后,往往能够获得更优的效果。不过,显式特征交互(如笛卡尔积)引入了巨量额外参数,极大地增加了模型复杂度,导致了需要大量样本来学习模型。在本文中,我们提出了Feature Co-Action Network (CAN),该模型可以以极低的代价逼近显式特征交互建模。在CAN中,给定特征A及其相关特征B,它们的特征交互由特征协同单元(Co-Action Unit)通过学习两组参数来模拟:1)特征A的高维度向量表征(Embedding),2)与特征B对应的多层感知器(MLP)。最终,二者的特征交互可以通过Embedding与MLP 的计算获得,Co-Action Unit拥有的对复杂特征交互的强大拟合能力能够逼近显式特征交互的效果。值得一提的是,FM可以视为CAN在MLP的层数为1时的一个特例。在工业数据集和常用公开数据集上的实验研究结果表明,CAN的效果优于当前最先进的CTR模型。CAN已成功在阿里巴巴的展示广告系统中部署上线,在CTR和RPM等关键指标上分别取得了12%与8%的提升,为平台带来了巨大的收益。

  An Adaptive Unified Allocation Framework for Guaranteed Display Advertising

一种合约展示广告自适应分配统一框架
摘要: 合约保量广告(Guaranteed Display, GD)被广泛应用于电商营销中,为广告主提供合同约定的目标人群展示次数。除了最大化合约完成率这个主要目标外,用户兴趣(如点击率和转化率)对于提高广告主和电商平台的长期投资回报也至关重要。在本文中,我们设计了一个合约广告自适应统一分配框架(Adaptive Unified Allocation Framework, AUAF),不仅考虑了请求级别的广告展示量,而且避免了展示次数的过度分配。具体来说,我们的分配模型同时优化合约完成率和广告与用户兴趣之间的匹配程度,并具有显式约束,以防止不必要的过度分配。面对每天服务十亿级广告请求的挑战,还开发了一种基于PS的并行优化算法,使所提出的分配模型能够在几分钟内得到有效训练和增量更新。因此,离线训练和在线决策可以同步进行实时服务。也就是说,我们的方法可以实现在线决策与离线最优分配解决方案一致的自适应调整。通过广泛的实验结果表明,我们提出的 AUAF 框架可以提高合约广告完成率和平均点击率 (本文中用点击率来衡量用户对广告的兴趣)。与现有的其他方法相比,我们的方法对CTR 的改进在统计上是显着的。此外,自2020年3月起,AUAF已经部署在阿里巴巴的品牌合约展示广告系统中,在不损失合约完成率的情况下带来了10%以上的点击率提升,为业务创造了显着的价值。

  A Cooperative-Competitive Multi-Agent Framework for Auto-bidding in Online Advertising

一种用于在线广告自动竞价的协作竞争多智能体框架
论文下载:https://arxiv.org/pdf/2106.06224.pdf
摘要: 在在线广告中,自动竞价已经成为广告主优化自身广告性能的必需工具,自动竞价允许广告主通过简单地设置计划目标以及相应约束来优化其关心的广告性能指标。之前的工作大多从单智能体的角度考虑自动竞价问题,而没有建模智能体之间的相互影响。本文从分布式多智能体系统的角度研究自动竞价智能体的设计问题,并提出了一个通用的多智能体自动竞价框架,称为MAAB(Multi-Agent Auto-bidding),用以学习自动竞价策略。首先,我们研究自动竞价智能体之间的竞争与合作关系,并提出了一种基于温度调控的奖励分配机制来建立自动竞价智能体之间的混合协作竞争关系。通过调节竞价智能体之间的协作与竞争,从而达到了一种能够同时保证广告主自身效用和社会福利最大化的均衡状态。其次,我们观察到协作关系会引导智能体走向非最优的行为模式,从而损害多方的收入。为了解决这个问题,我们引入了门槛智能体来为每一个自动竞价智能体设置个性化的竞价策略,进而降低多方利益的减少。第三,为了将MAAB部署到拥有数百万广告主的大型广告系统中,我们提出了一种基于平均场方法。通过将目标相同的广告主分组为一个均值自动竞价智能体,广告主之间的复杂交互得以简化,从而使MAAB得以高效训练。在工业离线数据集以及阿里巴巴广告平台的实验表明,本文的方法在广告主社会福利以及平台利益上能够超越基准算法。

END

欢迎关注「阿里妈妈技术」,了解更多~
疯狂暗示↓↓↓↓↓↓↓

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存